智能论文笔记

COV19IR : COVID-19 Domain Literature Information Retrieval

Arusarka Bose , Zili Zhou , Guandong Xu

分类：自然语言处理

2022-11-08

Increasing number of COVID-19 research literatures cause new challenges in effective literature screening and COVID-19 domain knowledge aware Information Retrieval. To tackle the challenges, we demonstrate two tasks along withsolutions, COVID-19 literature retrieval, and question answering. COVID-19 literature retrieval task screens matching COVID-19 literature documents for textual user query, and COVID-19 question answering task predicts proper text fragments from text corpus as the answer of specific COVID-19 related questions. Based on transformer neural network, we provided solutions to implement the tasks on CORD-19 dataset, we display some examples to show the effectiveness of our proposed solutions.

translated by 谷歌翻译

Active entailment encoding for explanation tree construction using parsimonious generation of hard negatives

Alex Bogatu , Zili Zhou , Dónal Landers , André Freitas

分类：自然语言处理 | 人工智能

2022-08-02

已经提出了需要树木，以模拟在开放域的文本问题答案的背景下进行解释产生的人类推理过程。但是，实际上，手动构建这些解释树是一个艰苦的过程，需要积极的人类参与。鉴于捕获从问题到答案的推理线的复杂性，或者从索赔中捕获了前提，因此出现了如何帮助用户有效地构建多个级别的树木，并给定大量可用事实。在本文中，我们将需要树的构造作为一系列主动的前提选择步骤，即，对于说明树中的每个中间节点，专家需要注释大型候选人列表中的前提事实的正面和负面示例。然后，我们迭代地进行精细 - 训练前训练的变压器模型，并产生了正面和紧密控制的负面样本，并旨在平衡语义关系和解释性的关系关系的编码。实验评估证实了拟议的主动精细研究方法的可测量效率提高，以促进累积树的构建：与几种替代方案相比，解释性前提选择的提高了20 \％。

translated by 谷歌翻译

Digital-twin-enhanced metal tube bending forming real-time prediction method based on Multi-source-input MTL

Chang Sun , Zili Wang , Shuyou Zhang , Taotao Zhou , Jie Li , Jianrong Tan

分类：机器学习 | 人工智能

2022-07-03

作为使用最广泛的金属管弯曲方法之一，旋转拉动弯曲（RDB）过程可实现可靠和高精度的金属管弯曲（MTBF）。形成准确性受到回避和其他潜在形成缺陷的严重影响，其机制分析很难处理。同时，现有方法主要是在离线空间中进行的，忽略了物理世界中的实时信息，这是不可靠且效率低下的。为了解决这个问题，提出了基于多源输入多任务学习（MTL）的数字增强（DT增强）金属管弯曲弯曲的实时预测方法。新方法可以实现全面的MTBF实时预测。通过共享多关闭域的共同特征并在功能共享和接受层上采用组正规化策略，可以保证多源输入MTL的准确性和效率。通过DT增强，物理实时变形数据通过改进的格莱美角度场（GAF）转换在图像维度中对齐，从而实现了实际处理的反射。与传统的离线预测方法不同，新方法集成了虚拟和物理数据，以实现更有效，更准确的实时预测结果。可以实现虚拟系统和物理系统之间的DT映射连接。为了排除设备误差的影响，在物理实验验证的FE模拟方案上验证了所提出的方法的有效性。同时，将通用的预训练网络与提出的方法进行比较。结果表明，所提出的DT增强预测方法更准确和有效。

translated by 谷歌翻译

Transformers and the representation of biomedical background knowledge

Oskar Wysocki , Zili Zhou , Paul O'Regan , Deborah Ferreira , Magdalena Wysocka , Dónal Landers , André Freitas

分类：自然语言处理 | 人工智能 | 机器学习

2022-02-04

专门的基于变形金刚的模型（例如生物Biobert和Biomegatron）适用于基于公共可用的生物医学语料库的生物医学领域。因此，它们有可能编码大规模的生物学知识。我们研究了这些模型中生物学知识的编码和表示，及其支持癌症精度医学推断的潜在实用性 - 即，对基因组改变的临床意义的解释。我们比较不同变压器基线的性能；我们使用探测来确定针对不同实体的编码的一致性；我们使用聚类方法来比较和对比基因，变异，药物和疾病的嵌入的内部特性。我们表明，这些模型确实确实编码了生物学知识，尽管其中一些模型在针对特定任务的微调中丢失了。最后，我们分析了模型在数据集中的偏见和失衡方面的行为。

translated by 谷歌翻译

PhysNLU: A Language Resource for Evaluating Natural Language Understanding and Explanation Coherence in Physics

Jordan Meadows , Zili Zhou , Andre Freitas

分类：自然语言处理

2022-01-12

为了掌握语言模型来帮助物理研究，他们必须首先编码数学和自然语言话语的表示，这导致相干的解释，正确的排序和陈述的相关性。我们提出了一系列开发的数据集，以评估语言模型在这方面的性能，这对句子排序，位置，截面预测和话语一致性的能力测量。数据分析显示了物理话语中最常见的方程和子学科，以及方程式和表达的句子级频率。我们提出了基本的基线，展示了当代语言模型在物理学中的一致性相关任务是如何挑战的，即使在数学自然语言目标上培训也是如此。

translated by 谷歌翻译

Few-shot Query-Focused Summarization with Prefix-Merging

Ruifeng Yuan , Zili Wang , Ziqiang Cao , Wenjie Li

分类：自然语言处理 | 人工智能

2022-11-29

Query-focused summarization has been considered as an important extension for text summarization. It aims to generate a concise highlight for a given query. Different from text summarization, query-focused summarization has long been plagued by the problem of lacking high-quality large-scale datasets. In this paper, we investigate the idea that whether we can integrate and transfer the knowledge of text summarization and question answering to assist the few-shot learning in query-focused summarization. Here, we propose prefix-merging, a prefix-based pretraining strategy for few-shot learning in query-focused summarization. Drawn inspiration from prefix-tuning, we are allowed to integrate the task knowledge from text summarization and question answering into a properly designed prefix and apply the merged prefix to query-focused summarization. With only a small amount of trainable parameters, prefix-merging outperforms fine-tuning on query-focused summarization. We further discuss the influence of different prefix designs and propose a visualized explanation for how prefix-merging works.

translated by 谷歌翻译

Physical Logic Enhanced Network for Small-Sample Bi-Layer Metallic Tubes Bending Springback Prediction

Chang Sun , Zili Wang , Shuyou Zhang , Le Wang , Jianrong Tan

分类：机器学习

2022-09-20

双层金属管（BMT）在工程应用中起着极其至关重要的作用，旋转弯曲弯曲（RDB）可以实现高精度弯曲处理，但是，该产品将进一步弹回。由于BMT的复杂结构和数据集获取的高成本，基于机制研究和机器学习的现有方法无法满足Spresback预测的工程要求。根据初步机制分析，提出了物理逻辑增强网络（PE-NET）。该体系结构包括ES-NET等效BMT与单层管等效，SP-NET用于带有足够的单层管样品的浮回本的最终预测。具体而言，在第一阶段，通过理论驱动的预探测和数据驱动的预处理，ES-NET和SP-NET分别构建。在第二阶段，在物理逻辑下，PE-NET由ES-NET和SP-NET组装，然后与小样本BMT数据集和复合损耗函数进行微调。 FE模拟数据集，小样本数据集BMT BMT弹回角预测验证了所提出方法的有效性和稳定性，并证明了跨性别和工程应用程序的潜在方法。

translated by 谷歌翻译

Boosting Sensitivity of Large-scale Online Experimentation via Dropout Buyer Imputation

Sumin Shen , Huiying Mao , Zezhong Zhang , Zili Chen , Keyu Nie , Xinwei Deng

分类：机器学习

2022-09-09

In online experimentation, appropriate metrics (e.g., purchase) provide strong evidence to support hypotheses and enhance the decision-making process. However, incomplete metrics are frequently occurred in the online experimentation, making the available data to be much fewer than the planned online experiments (e.g., A/B testing). In this work, we introduce the concept of dropout buyers and categorize users with incomplete metric values into two groups: visitors and dropout buyers. For the analysis of incomplete metrics, we propose a clustering-based imputation method using $k$-nearest neighbors. Our proposed imputation method considers both the experiment-specific features and users' activities along their shopping paths, allowing different imputation values for different users. To facilitate efficient imputation of large-scale data sets in online experimentation, the proposed method uses a combination of stratification and clustering. The performance of the proposed method is compared to several conventional methods in both simulation studies and a real online experiment at eBay.

translated by 谷歌翻译

Graph R-CNN: Towards Accurate 3D Object Detection with Semantic-Decorated Local Graph

Honghui Yang , Zili Liu , Xiaopei Wu , Wenxiao Wang , Wei Qian , Xiaofei He , Deng Cai

分类：计算机视觉

2022-08-07

两阶段探测器在3D对象检测中已广受欢迎。大多数两阶段的3D检测器都使用网格点，体素电网或第二阶段的ROI特征提取的采样关键点。但是，这种方法在处理不均匀分布和稀疏的室外点方面效率低下。本文在三个方面解决了这个问题。 1）动态点聚集。我们建议补丁搜索以快速在本地区域中为每个3D提案搜索点。然后，将最远的体素采样采样用于均匀采样点。特别是，体素尺寸沿距离变化，以适应点的不均匀分布。 2）Ro-Graph Poling。我们在采样点上构建本地图，以通过迭代消息传递更好地模型上下文信息和地雷关系。 3）视觉功能增强。我们引入了一种简单而有效的融合策略，以补偿具有有限语义提示的稀疏激光雷达点。基于这些模块，我们将图形R-CNN构建为第二阶段，可以将其应用于现有的一阶段检测器，以始终如一地提高检测性能。广泛的实验表明，图R-CNN的表现优于最新的3D检测模型，而Kitti和Waymo Open DataSet的差距很大。我们在Kitti Bev汽车检测排行榜上排名第一。代码将在\ url {https://github.com/nightmare-n/graphrcnn}上找到。

translated by 谷歌翻译

Ultra-low Latency Adaptive Local Binary Spiking Neural Network with Accuracy Loss Estimator

Changqing Xu , Yijian Pei , Zili Wu , Yi Liu , Yintang Yang

分类：神经与进化计算

2022-07-31

尖峰神经网络（SNN）是一种受脑启发的模型，具有更时空的信息处理能力和计算能效效率。但是，随着SNN深度的增加，由SNN的重量引起的记忆问题逐渐引起了人们的注意。受到人工神经网络（ANN）量化技术的启发，引入了二进制SNN（BSNN）来解决记忆问题。由于缺乏合适的学习算法，BSNN通常由ANN-SNN转换获得，其准确性将受到训练有素的ANN的限制。在本文中，我们提出了具有准确性损失估计器的超低潜伏期自适应局部二进制二进制尖峰神经网络（ALBSNN），该网络层动态选择要进行二进制的网络层，以通过评估由二进制重量引起的错误来确保网络的准确性在网络学习过程中。实验结果表明，此方法可以将存储空间降低超过20％，而不会丢失网络准确性。同时，为了加速网络的训练速度，引入了全球平均池（GAP）层，以通过卷积和合并的组合替换完全连接的层，以便SNN可以使用少量时间获得更好识别准确性的步骤。在仅使用一个时间步骤的极端情况下，我们仍然可以在三个不同的数据集（FashionMnist，CIFAR-10和CIFAR-10和CIFAR-100）上获得92.92％，91.63％和63.54％的测试精度。

translated by 谷歌翻译